Мощная и платная система анализа речи.
С помощью нее можно захватывать, редактировать и анализировать звуковые сигналы одним нажатием кнопки. Частота, усиление, фильтр скорость контролируется программным обеспечением. Анализируются спектрограммы, интенсивности и высоты звука. Программа читает много типов аудио данных.
Система Praat предлагает различные полезные инструменты для работы с речью данных, в том числе инструменты для расшифровки и аннотации на нескольких уровнях.
Эта компьютерная программа, позволяет анализировать, синтезировать и манипулировать речью, а также создавать высококачественные изображения для статей и тезисов.
Программы для фонетического и фонологического анализа (Phonology Assistant IPA Help, Speech Analyzer).
Вы можете использовать Speech Analyzer:
Для выявления основной частоты, спектрального анализа и продолжительности измерений.
Анализа музыкальных записей.
Замедлять воспроизведения, повторять композиции с целью оказания помощи в восприятии и мимики для изучения языка.
Программа Phonology Assistant отслеживает фонетические данные с клавиатуры и из речи записи анализатора звука. Она использует стандартные символы IPA для индексации и отображения данных.
Представляет собой очень мощный звуковой редактор для поддержки различных форматов, включая MP3, AAC, Ogg Vorbis, Apple Lossless, AIFF, Wave и многих других. Он работает на MacOS 9.2 и до, а также изначально работал на MacOS X.
Другие особенности включают импорт / экспорт данных, возможность для разделения и объединения файлов вместе, и в режиме реального времени спектрального анализа и осциллографа.
Snack это инструментарий для обработки акустических данных с акцентом на свободу слова. Он имеет визуализацию в реальном времени, поддерживает множество форматов файлов, а также является расширяемым.
Просмотр речевого сигнала и возможность фонетических меток, всё это включено в пакет. Существует также Snack "плагин" для веб-браузеров. Wavesurfer это инструмент, основанный на Snack. http://www.speech.kth.se/wavesurfer/
Это полная интегрированная компьютерная студия для создания музыки. Разработанная той же командой инженеров, ответственных за системы высокого класса Pro Tools | HD, интерфейс Digidesign Pro Tools снабжен отличным аналоговым сигналом и преобразователем высокой производительности для лучшего звучания.
Включенное ПО Pro Tools на одной платформе используется в коммерческих объектах по всему миру и обеспечивает Pro совместимость студии и всего необходимое, чтобы сочинять, записывать, редактировать и микшировать музыку. Digidesign Pro Tools также предоставляет сторонние драйвера для надежной интеграции практически со всеми популярными аудио приложения записи.
Самый быстрый и самый мощный недешеый профессиональный инструмент для обработки звука, мастеринга CD для OS X, точного моно и стерео редактирования.
Как он гордо помечен производителем «Индустриальный стандарт». Peak Pro — это полноценная рабочая станция «все-в-одном» с неплохим выбором собственных (DSP) эффектов обработки, и возможностью расширить этот набор плагинами BIAS, VST и Audio Units.
В новой версии 6.0 появились расширенные функции управления переходами и уровнями звука, редактирования, также было серьезно доработан интерфейс.
GoldWave является высоко оцененный, профессиональный цифровой аудио редактор.Он полностью нацелен сделать все, от простейших записей до редактирования самых сложных обработок звука, восстановления, улучшения и преобразования. Он прост в освоении и использовании.
Особенности включают в себя огромное редактирования файла (4 ГБ и за ее пределами на NTFS-отформатированных дисков), высокое качество файлов (24 бит, 192 кГц), в режиме реального времени изображения (бар, волны, спектрограммы, спектр, измеритель уровня шума), уменьшение шума, экспрессивная оценка и многое другое.
Ранее известная как CoolEditPro, Adobe Audition имеет целый ряд функциональных возможностей. Вы можете перемещать громкость, панораму, эффекты; вы можете слушать и записывать изменения в миксе в реальном времени, в режиме реального времени есть входной контроль.
Продукция высокого разрешения, 24 - или 32-разрядные файлы с частотой дискретизации до 192 кГц для аудио и HD-DVD-качества.
Создайте настроенный набор команд, скриптов и эффектов, которые легко доступны через меню Существует избранный или назначаемый набор сочетаний клавиш.
Легко восстановить записи из старых виниловых пластинок, удалить микрофонный треск, шипение, шумы, исправление обрезанных аудио, шумоподавление, и многое другое.
Audacity - это цифровая аудио-студия (digital audio studio), то есть программа, в которой можно микшировать звуковые дорожки, обрабатывать их эффектами и редактировать звуковой материал.
Программа распространяется свободно, занимает 4 КБ,имеет достаточно простой интерфейс и доступна для всех наиболее распространенных операционных систем. Кроме этого, в ней есть возможность редактировать звуковую дорожку. Рассчитывать на высокое качество записи не придется, однако этот вариант вполне приемлем для пробы сил и анализа своих возможностей.
WaveSurfer - это инструмент с открытым исходным кодом для звука визуализации и манипуляции. Она была разработана, чтобы удовлетворить как новичкам, так и продвинутых пользователей.
WaveSurfer имеет простой и логичный пользовательский интерфейс, который обеспечивает функциональность в интуитивно понятным способом, и которые могут быть адаптированы к различным задачам. Он может быть использован в качестве автономного инструмента для широкого круга задач в исследовании слова и образования. Типичные области применения речи / обоснованного анализа и звука аннотации / транскрипции.
WaveSurfer также может служить платформой для более продвинутых и специализированных приложений. Это достигается либо путем расширения сферы применения WaveSurfer с новых пользовательских плагинов или путем встраивания компонентов WaveSurfer визуализации в других приложениях.
Sound Forge - это очень мощный и удобный цифровой аудио-редактор, в состав которого входит набор утилит, предназначенных для работы со звуком. При помощи данной программы можно эффективно обрабатывать звуковые композиции, накладывать множество эффектов, осуществлять точную и быструю запись и редактирование сэмплов, кодировать данные, перегонять файлы в различные форматы и т.д.
Программа CLAN загружается, устанавливается и используется в качестве отдельного приложения.
Функционально, CLAN состоит из двух частей. 1)Первая часть CLAN редактор, который может быть использован для редактирования файлов в любой чат или СА (Беседа анализа) формате. Редактор также предоставляет широкий спектр дополнительных функций, таких как аудио и видео, связь с аудио и видео, шрифты для римской и нелатинских орфографии, проверки данных, добавляя код в файлы, и доставки данных в другие программы. 2)Вторая часть клана есть множество программ для анализа данных. Эти программы запускаются из отдельного окна, называемые «Командные окна». Результаты аналитических программ направляются в «окна Вывода» CLAN.
Программа WinCECIL предназначена для акустического и перцептивного анализа звучащей речи, при этом максимальная длительность анализируемого сигнала - 13 секунд. Ввод речи осуществлялся с видеокассеты на компьютер, при этом все виды анализа и все формы представления речи осуществляются и выводятся на экран в реальном масштабе речи.
Transana - инструмент для профессиональных исследователей, которые хотят разложить цифровое видео или аудиоданные. Transana позволяет вам анализировать и управлять своими данными очень сложными способами. Запишите, идентифицируйте аналитически интересные клипы, присвойте ключевые слова клипам, расположите и перестройте клипы, создайте комплексные наборы взаимосвязанных клипов, зондируйте отношения между примененными ключевыми словами, и совместно используйте ваш анализ с коллегами.
Результат - новый способ сосредоточиться на ваших данных, и новом способе управлять большим количеством видеофайлов и аудиофайлов и клипов.
Особенности устройства:
- Запишите видеофайлы или аудиофайлы.
- Идентифицируйте и легко получите доступ к аналитически существенным частям видеоданных.
- Управляйте большими телевизионными наборами, содержащими сотни (и потенциально тысячи) часов видео.
- Организуйте видеоклипы в значимые категории, как механизм для разработки и расширения теоретического понимания того, что показывает видео.
- Примените доступные для поиска аналитические ключевые слова к этим видеоклипам.
- Просмотрите графические и основанные на тексте отчеты о своем аналитическом кодировании.
- Участвуйте в комплексном анализе данных и тестировании гипотезы через большие телевизионные наборы.
- Совместно используйте аналитическую разметку с удаленными коллегами, чтобы облегчить совместный анализ.
Wordcorr – это новый инструмент для исследования и преподавания в сравнительной лингвистике, в настоящее время в производстве версия 2.0 для Windows 98/2000/XP.
Wordcorr автоматизирует утомительные процессы подведения итогов и управления звуковыми соответствиями, используемые в разработке исторического развития естественных языков. Данные могут быть введены с клавиатуры и отредактированы в полном Unicode. Электронные таблицы, WordSurv и Palmsurv, они опираются на экспорт внутренней базы данных Wordcorr в том числе анализы XML-файлов.
Filemaker Pro –это передовая и простая в использовании программа работы с базами данных, с помощью которой пользователи Windows Mac могут без опасений обмениваться информацией в популярных форматах, например PDF, через локальную сеть и через Интернет. Способность FileMaker Pro 10 упорядочить важные данные так, чтобы их можно было мгновенно найти, пригодится вам в управлении клиентской базой,лежении за ходом проекта, подготовке инвентарного отчета и других задачах.
FileMaker Pro 10 оснащен инструментом для пошагового создания отчетов, который поможет разобраться в данных и автоматизировать выполнение однообразных задач. Используйте "Помощник отчетов" для создания пользовательских макетов, меток и отчетов.
MonoConc Pro – быстрая программа конкорданс для переводчика (извлечение терминологии). Она используется для анализа английских или других текстов - испанских, французских, японских, китайских и т.д. - для лингвистического или языкового преподавания и изучения языков (ESL). Наряду с предоставлением KWIC результатов конкордансом, программное обеспечение производит также информацию о списках слов и словосочетаний.
Программа проста в использовании, хотя и поставляется с целым рядом мощных функций, таких как контекстный поиск, поиск по регулярному выражению, частеречный поиск по тегам, сочетаемости слов и корпус сравнения.
Программа MonoConc Pro разработана для работы в компьютерных сетях и работает под управлением Windows в различных средах (W95 и выше). Имеет приемлемое количество настроек для поиска, но при этом является платной.
Shoebox – это компьютерная программа, которая помогает лингвистам и антропологам интегрировать различные виды текстовых данных: лексических, культурных, грамматических и т.д.
Она имеет гибкие настройки для сортировки, отбора и отображения данных. Это особенно полезно для оказания помощи исследователям, построить словарь, так как они используют ее для анализа текста.
Программа для Macintosh, которая производит ключевые слова в контексте соответствующих слов в тексте. Программа также может сделать письмо согласований для облегчения фонологического анализа. Программа позволяет пользователю ограничить согласование только те слова, которые соответствуют заданному шаблону (GREP выражение).
Конкордансы могут быть как распечатаны, так и экспортированы в текстовые файлы.
Программа ZECKE – это инструмент конкорданса, для разговорного языка транскрипции в формате EXMARaLDA.
Возможности программы:
Позволяет обычную строку выражения для транскрипции материала. Выводит результат в виде KWIC согласования с возможностью отображения результатов поиска в контексте, в музыкальном представлении записи и воспроизведение соответствующей части транскрипции аудио-или видеозаписи.
A Simple Concordance Program – простая в использования и предоставляемой функциональности программа для переводчика, с помощью которой можно извлекать термины и словосочетания, задавая число слов в словосочетании. Поддерживаются алфавиты: Английский, Французский, Немецкий, Польский, Греческий, Русский.
Программа извлекает найденные термины в список, которые, после этого, могут быть отредактированы вручную.
Существует возможность подключить так называемый stop list - список из слов, которые не относятся к терминологии. К примеру, артикли, предлоги, общие слова (little, large). Вы можете взять stop list по следующей ссылке - скачать stop list (англ. язык, названия стран, предлоги, артикли, общие слова).
Мультимедийная программа словаря базы данных в Microsoft Visual FoxPro, который был создан специально для составления словарей индейских языков. В настоящее время, программе находится в завершающей стадии разработки.
Программа предназначена для поддержки стандартного текстового языкового материала, а также звуковых данных, графических изображений и видеоклипов.
FASTR – инструмент для автоматического индексирования и извлечения терминологии.
На входе корпус и перечень терминов, а на выходе индексированные данные корпуса, в котором признаются условия и варианты.
Программа может использоваться в двух режимах:
- Контролируемая индексация: вход состоит из корпуса и списка терминов;
- Бесплатная индексации: вход только состоит из корпуса, списка терминов, получаемых автоматически.
NLTK – это природный инструментарий языка, представляет собой набор программных модулей, наборов данных и учебников для поддержки исследований, обучения в компьютерной лингвистике и обработки естественного языка.
NLTK идеально подходит для студентов, которые изучают НЛП (Natural Language Processing) или проведения научных исследований в НЛП или смежных областях, в том числе эмпирической лингвистики, когнитивной науки, искусственном интеллекте, поиске информации и машинном обучении.
NLTK успешно используется в качестве учебного пособия, как отдельных инструментов исследования, и в качестве платформы для систем прототипирования и создания исследований.
WinPitchPro – это инструмент для выравнивания программного обеспечения, со встроенным акустическим анализатором: (спектрограммы, фундаментальные отслеживания частоты, интенсивности) и повторного синтеза (просодических морфинг).
Достоинства программы:
Переменная скорость воспроизведения, помощь выравнивания текста в речи. XML и Excel продукция, полностью совместима с Юникод.
Annotate – это простой в использовании, удобный, настраиваемый, и графический инструмент для аннотирования предложения с синтаксическими структурами, которые были успешно использованы при создании Negra корпуса.
Annotate обеспечивает удобный и настраиваемый графический интерфейс пользователя, что значительно облегчает трудоемкую задачу синтаксической аннотации. По этой причине он уже используется в ряде проектов. Комментировать доступна бесплатно для научных целей.
Audiamus – создает связь между текстами и средствами массовой информации, на основе временного кода, получаемого от переработки в Transcriber или аналогичных программах.
Необходимость специального инструмента, возникла в отсутствии простого способа работы в интерактивном режиме с цифровой этнографические лентой поля, через их стенограмму.Инструмент разработан с ключевым принципом повторного использования и доступа к данным.
С Audiamus пользователь может нажать на любое предложение или кусок в корпусе и услышать его или просмотреть видео. Версия 2.3 добавляет возможность повторять играющие куски и замедлять.
Word Frequency Text Profiler – этот инструмент можно использовать во многих отношениях для поддержки преподавания, обучения и исследований. Инструмент сравнивает все слова в тексте с двумя списками частотности слов, обеспечивает визуальный профиль распределения этих слов в тексте при печати, различные частотные диапазоныокрашиваются в разные цвета.
Emdros – это процессор текстовой базы данных для аннотирования и анализа текстов.
Прикладные области применения включают лингвистику, публикацию, текстовую обработку, и любые другие области, которые имеют дело с аннотируемым текстом. Emdros обеспечивает концептуальную модель текста, который может весьма освобождать, чтобы использовать, как только это было схвачено.
Emdros имеет мощный язык запросов для поиска релевантных запросу данных. Это связующее звено, функционирующее между клиентской частью (написанной пользователем) и нижележащей базой данных. Имеет поддержку PostgreSQL и MySQL.
Emdros обеспечивает определенную абстракцию текста, который делает его идеально подходящий для хранения и восстановления аннотируемого текста, такого как лингвистические исследования текста.
SystemicCoder - программа, облегчающая процесс метаописания корпуса текстов. Метаданные задаются на основе классификационной схемы.
Программа состоит из 5 интерфейсов. TextSegmentation: разметка границ между сегментами текста; SchemeManagement: настройка классификационной схемы; Coding: разметка текста; Review: просмотр размеченного текста; Statistics: интерфейс, позволяющий получить описательную статистику о тексте, или разделить его на две или более совокупности и статистически их сравнить.
Данный инструмент способствует языковой кодировки материала, через побуждение пользователей к соответствующим категориям. Лингвистические особенности организованы с точки зрения системной сети - иерархия наследования - уменьшает количество кодирования.
Emacs - это программа с практически неограниченными возможностями. Emacs написан на Lisp - очень мощном языке программирования, характерной особенностью которого является то, что любая написанная на этом языке программа автоматически сама для себя является компилятором Lisp. Это означает, что пользователь может самостоятельно расширять возможности Emacs, а по сути писать новые программы “на Emacs'е”.
Существует две основные версии Emacs: GNU Emacs (эта версия входит в состав Slackware) и XEmacs. В настоящее время обе версии активно разрабатываются, и между двумя командами разработчиков ведётся тесное сотрудничество.
Toolbox - представляет собой инструмент управления и анализа данных для лингвистов. Это особенно полезно для поддержания лексических данных, а также для анализа текста, но он может быть использован и для управления практически любыми данными.
Панель инструментов построена подобно программе Shoebox 5. Toolbox добавляет поддержку Unicode, есть автоматическое переключение клавиатуры с Keyman 5 и 6, и проверка подстрочного текста. Проверка означает, что при повторном анализе текста, она не заменит ваш выбор, а просто увидит где есть неопределенность.
Поддержка Unicode не является полной, в частности, программа не поддерживает китайские иероглифы. Программа использует визуализацию Windows, следовательно, не поддерживает специальных символов в области использования, поэтому вы должны использовать Keyman для ввода данных.
XML экспорт поддерживается, но нет никакой проверки корректности.
FieldWorks – это ряд программных инструментов, которые управляют культурными и лингвистическими данными от начального набора до представления их для издания.
Выборка того, что поддерживает FieldWorks:
- процесс разработки Словаря, который определяет подход для создания и совершенствования словаря;
- категоризация культурных наблюдений;
- комплексные неримские сценарии, используется Unicode и разработанный SIL-Графит;
- большинство систем письменности (кроме вертикального сценария);
- ограниченная многопользовательская емкость, которая открывает дверь в кластерный проект, перерабатывает Интернет или LAN.
LinguaLinks Workshops – это программный инструмент, который управляет языковыми данными.
Инструмент включает в себя инструменты, которые помогут вам анализировать и публиковать тексты, управлять лексическими данными и опубликовать словарь.
Инструменты для анализа подстрочного текста включают: редактор словоформы, анализа морфологии, и инструмент инвентаря словоформы, который дает согласие на проявления словоформ в контексте.
Лексический менеджера баз данных объединяет лексические элементы с анализируемым текстом корпуса и поддерживает семантические перекрестные ссылки через тематические группы отношений и тезаурус категорий. Вся библиотека LinguaLinks входит в комплект поставки.
Lexique Pro – представляет собой интерактивный словарь, с гиперссылками между записями, категорий представлений, словаря обращений, поиска и экспорта инструментов.
Словарь может быть сконфигурирован для отображения панели инструментов / Shoebox баз данных в удобном для пользователя формате, так что вы можете распространять его среди других.
Программа читает данные из базы данных. Лексические статьи выводятся с левой стороны экрана в сортированном списке. На домашней странице, списки слов могут быть выбраны, щелкая по соответствующим буквам алфавита. Можно переместиться вокруг своего словаря, щелкая по гиперссылкам.
Lexique Pro создает гиперссылки к связанным записям, таким как синонимы, морфемы, основные записи, перекрестные ссылки и промежуточные штреки.
Можно включать одно или более изображений для каждой записи словаря. Поддерживаемые форматы изображения - JPG, PNG, GIF и BMP.
Ellogon – многоязычное, поперечная платформа, языковая окружающая среда, которая разработана для общего назначения, развитая помочь обоим исследователям, которые делают исследование в компьютерной лингвистике, так же как компании, которые производят и поставляют разработанные языковые системы.
Как языковая платформа, Ellogon предлагаетобширный набор услуг, включая инструменты для обработки и визуализации такста, HTML, XML данных. Поддержку лексических ресурсов как создание и вложение словарей, инструментов для того, чтобы создать аннотируемые корпуса, получая доступ к базам данных, сравнивая аннотируемые данные, или преобразовывая лингвистическую информацию в векторы для использования с различными машинными алгоритмами изучения.
PhoneBox – это утилита для фонологического анализа данных с использованием языка.
С PhoneBox вы можете: 1)использовать фонетические данные, собранные с панели инструментов без импорта или преобразования; 2)создать таблицу всех телефонов в ваших данных, и как часто они происходят (телефон инвентаризации); 3)создания среды-карты всех телефонов в ваших данных; 4)отметить телефоны, неопределенность в данных, а затем создать карты всех; неопределенных телефонов;увидеть, как интерпретация неоднозначного сегмента и неоднозначной последовательности влияет на слог модели данных. 5)создать диаграмму всех сегментов последовательностей в данных, которые соответствуют (графики распределения); 6)использовать любой шрифт или символ для обозначения поддерживаемых инструментов, в том числе Unicode UTF-8; 7)Импорт таблицы порожденных PhoneBox в Microsoft Word для отображения и печати, телефонные карты или карты распределения. PhoneBox – стандартная программа для работы с данных в панели инструментов лингвиста.
PalmSurv – это программное обеспечение, позволяющее делать списки слов в какой то области данных.
Различные представления данных позволяют визуально сравнивать списки слов. Данные списка слов могут быть переданы к настольному компьютеру через HotSync.
PalmSurv предназначена только в качестве сбора данных и не делает любой статистический анализ собранных данных.
System Quirk – приложение предназначено для оказания помощи в создании и поддержании текстов и терминов. Эти приложения имеет особое значение для прикладных лингвистов и языковых инженеров.
Приложение использует действительно объектно-ориентированное представление данных терминологии и усовершенствованный анализатор текста и его визуализацию.
Менеджер терминологии данных системы Quirk уже настроен на поддержку терминологии баз знаний. Профиль для выполнения различных задач может быть предопределен опытным пользователем, чтобы начинающим пользователям работа была более продуктивной.
Kirrkirr – этот исследовательский проект изучает возможность использования программного обеспечения для автоматического преобразования лексической базы данных ("Словари"), направленной на обеспечение инновационного визуализации информации, особенно ориентированных на языки коренных народов.
ITP – представляет собой набор программных инструментов для разработки свода аннотированных подстрочных текстов.
ITP выполняет две основные задачи:
(1) он сохраняет вертикальное выравнивание подстрочных примечаний;
(2) в нем хранятся все аннотации лексической базе данных, что позволяет полуавтоматический глоссинг.
Он поддерживает до 14 уровней согласования аннотации текста и до 8 различных произвольной формы (nonaligning) аннотации. Подстрочный текстовый файл производства - это обычный текстовый файл, доступный для других текстовых программ по обеспечению текстовойобработки.
XMLSpy – это лидирующая среда разработки XML в своей сфере, предоставляющая понятные редакторские виды и мощные XML утилиты, для моделирования, редактирования, трансформации и устранения неполадок технологий относящихся к XML быстро и легко.
XMLSpy стал одним из наиболее признанных инструментов своей категории вскоре после его выпуска в 1999. Продукт часто обновляется, чтобы обеспечивать поддержку новейших технологий. Была добавлена поддержка стандарта Office Open XML, применяющегося в Microsoft Office 2007.
XMLSpy поддерживает несколько режимов и возможностей редактирования, как например: 1)Создание и редактирование документов на основе XML 2)Визуальная разработка XML Schema 3)Редактирование DTD 4)Разработка и отладка XSLT 1.0/2.0 5)Разработка и отладка XQuery 6)Разработка и анализ XPath 1.0/2.0 7)Разработка Office Open XML 8)Разработка веб-служб 9)Графическое создание и редактирование WSDL 10)Разработка и отладка SOAP 11)Генерация кода Java, C++, C#
AGTK - это набор программных компонентов для создания инструментов для аннотирования языковых сигналов, временных рядов данных, которые документирует любое языковое поведение (например: аудио, видео).
Annotation Graph абстрагируются от форматов файлов, схем кодирования и пользовательских интерфейсов, обеспечивая логический уровень для аннотационных систем.
Ktagger – это автономное приложение, построенное с базовыми функциями PC-Киммо в разборе. Она принимает в качестве входных файлов список слов, состоящих из одного слова в каждой строке, и производит на выходе структурированные текстовые файлы, содержащие морфологический разбор. Содержание и формат выходного файла определяется "контроль" файл построенный пользователем.
KTagger может быть использован для производства лексикона слова или любого другого вида структурированного выхода. Для использования KTagger, необходимо PC-Киммо языка описания, такие как Englex. Описание должно включать файл грамматики.
KTagger позволит вам использовать морфологический анализатор для маркировки.
MediaTagger – является бесплатной программой, для редактироватния комментариев (тегов) в мультимедийных звуковых файлах.
Формат MP3 (уровень MPEG 3) является форматом музыкального файла. Каждый файл MP3 может содержать тег ID3. Это - фактически информация, хранящаяся прямо в том файле MP3. У тега ID3 есть несколько ячеек, которые можно установить: Артист, Альбом, Год, Жанр, Комментарий и еще несколько, такие как: Формирователь, Исходный артист, Авторское право, URL, тип Кодера, и т.д.
Ktext – читает текст из файла на диске, анализирует каждое слово с помощью анализатора PC-KIMMO и записывает результаты в новый файл на диске.
Этот новый файл в виде структурированного текстового файла, где каждое слово исходного текста представляется в виде записи в базе данных состоящей из нескольких полей. Каждое слово записи содержит поля для исходного слова, поле для основной или лексической формы слова.
LINGuistic Ontology – является основой для лингвистов и позволяет в полной мере воспользоваться семантическими веб-технологиями.
Программа позволяет лингвистам размечать любой документ с классами в одной или нескольких онтологиях на уровне морфем.
WinCecil – программа для просмотра записи речи и составления спектрограмм. Предел записи речи составляет 3 секунды.
Модернизированная версия называется Speech Analyzer, которая является свободным и профессиональным инструментом, который показывает различные графические изображения речи и звукозаписей. Это позволит вам выполнять фонетический анализ записей человеческого голоса (полный со спектрограммами, спектральным анализом, и т.д.), и этнологические изучения звукозаписей. Программа может показать вам до шести графических изображений того же самого звука или группу звуков в одном единственном экране, таким образом облегчающем для вас выполнять все виды сравнительного анализа. Все доступные графики могут быть полностью настроены, чтобы приспособить ваше предпочтение.
AMPLE - это морфологический анализатор для лингвистического исследования, при наличии необходимых сведений о морфологии языка, достаточно будет проанализировать каждое слово в тексте и разбить его на морфемы.
AMPLE ориентирован на "пункт и расположение" подход к описанию морфологических явлений. AMPLE работает вместе с печатью (OPAC 15) для автоматизированного связанной адаптации языка (CARLA). Он также может быть использован в сочетании с ITF (OPAC 17),для публикации текстов.
ATP - представляет собой текстовый процессор предназначенный для управления подстрочным текстом и поддержанием операций нескольких видов: лингвистического анализа, включая синтаксический анализ и глоссинг.
Анализа подстрочного текста является одним из основных форм языкового исчисления, в котором текст организован слово за словом, и выстраивается в блоки.
Редактор обеспечивает автоматизированный глоссинг, анализ и аннотацию лингвистических данных текста. По запросу возможно получить глоссы или аннотации к данному слову из коллекции до аннотаций в одном корпусе.
jEdit – это бесплатный текстовый редактор созданный для упрощения работы программистов.
Среди возможностей управления открытым документом можно отметить средства для вертикального выделения, для выделения нескольких фрагментов текста, расположенных в разных местах файла. Если требуется найти в документе определенное сочетание символов, можно обратиться к встроенным средствам для поиска. jEdit позволяет выполнять поиск в нескольких файлах одновременно, автоматически заменять одно выражение другим.
Данный редактор отличная замена платным программам, имеется все функции для работы, возможности программы легко расширяются благодаря большому количеству плагинов. Имеется поддержка всех основных языков программирования и верстки.
Keyman – это менеджер горячих клавиш, который позволяет работать с нестандартными клавишами на мультимедийных расширенных клавиатурах, без установки дополнительных драйверов.
Программа проста в управлении, но содержит множество дополнительных настроек и будет полезна как простым пользователям, так и профессионалам - настоящим клавиатурным маньякам.
Возможности программы:
-Использование любых клавиш, в том числе системных – Win+D, Alt+Tab, ect.
-Использование кнопок мыши в горячих клавишах - Mouse LButton, Mouse RButton, Mouse MButton, Mouse XButton1, Mouse XButton2 (например: Ctrl+Alt+Mouse MButton).
-Запись и воспроизведение клавиатурных макросов.
-Изменение клавиатурных раскладок.
-Отправление окна сообщения при нажатии клавиши.
-Многоязычный интерфейс.
Graphite – это проект, который может быть использован для создания "умных шрифтов", способных отображать системы письма различными сложными формами поведения.
Graphite предназначен для использования в качестве основной нелатинской визуализации для пакета работ, нового поколения языковых средств для перевода по развитию в SIL. Библиотеки Graphite доступны для любого разработчика программного обеспечения, который работает по развитию многоязычных приложений обработки текста.
Ukelele – это редактор раскладки клавиатуры для операционной системы Mac OS X версии 10.2 и выше.
Целью редактора является упрощение редактирования раскладки клавиатуры, предоставляя графический интерфейс.
При создании новой раскладки вам предложат создать абсолютно пустую, либо основанную на системной или готовой. Надёжнее выбрать третий вариант и нажав «ОК» найти среди полученный с программой раскладок русскую (Cyrillic/Russian.keylayout). Перед вами появится готовая раскладка, которую можно изменять на ваше усмотрение.
TypeTool – редактор шрифтов с базовой функциональной нагрузкой. Программа создана на основе пакета FontLab, отличается от него упрощенностью и более низкой ценой. Редактор предназначен для создания новых и редактирования готовых шрифтов форматов Post Script Type 1 (CFF/.otf) и TrueType (.ttf).
С помощью TypeTool можно создать новый шрифт, добавить лигатуры, дроби, валютные знаки. Поддерживаются неалфавитные шрифты и политипажи. В готовый шрифт можно добавить короткое тире, длинное тире, апострофы, кавычки. Возможно создать модификацию шрифта, а также преобразовать его формат. TypeTool имеет встроенные средства для печати таблиц символов.
Операциииинструменты, доступныев TypeTool: Draw, Erase, Rotate, Skew, Zoom, Set Startpoint, Insert Node, Remove Overlap, Merge Contours, Subtract Contours, Intersect Contours, Snap to Guides, Ruler, Undo (200 позиций), Autohint, Remove hints, Decompose.
К сожалению, программа не имеет русификации и руководства на русском языке. Поэтому для начала будет полезно открыть готовый шрифт и на нем изучить основные операции. После этого можно приступать к выполнению более сложных задач.
DGgraph – является PostScript-библиотекой, которая используется для создания дуг графа, опирающаяся на спецификацию графа зависимостей (синтаксис дерева).
PostScript файл может быть преобразован в другие графические форматы, такие как EPS / EPSF, PS, PDF, PNG, GIF, и JPEG.
DGgraph позволяет пересечению дуг (разрывов), что позволяет каждому узлу содержать произвольное количество меток, расположенных друг под другом. Таким образом, можно сделать два набора дуг: один набор над узлами, и другой набор узлов ниже. Последнии распадаются на несколько строк и страниц, если график не помещается на одной строке или странице.
FontLab Studio – это уникальный профессиональный редактор шрифтов. Программа, которая даёт возможность редактирования шрифтов на профессиональном уровне.
Она используется такими известными компаниями, как Adobe, Apple, Bitstream, IBM, Linotype, Microsoft, Monotype и многими другими. Fontlab Studio создана для печатников, профессиональных дизайнеров и студии, занимающихся графическим дизайном. Она поддерживает такие шрифты как TrueType, Type 1 (PS), OpenType и Unicode. FontLab Studio обеспечивает огромный выбор различных функций для создания, модификации и обработки шрифтов.
SignStream – это инструмент для анализа языковых данных, полученных из видео. SignStream разработан специально для работы с данными из американского языка жестов, но этот инструмент может быть применен к любому языку данных, полученных из видео.
SignStream предоставляет единую среду для работы с цифровым видео и связывания последовательностей кадров, одновременно, с происходящими языковыми событиями, которые закодированы в мелкозернистые многоуровневые транскрипции.
Предоставляя усовершенствованные возможности поиска, SignStream предоставляет мгновенный доступ к данным. Кроме того, многочисленные высказывания могут быть открыты одновременно, что позволяет одновременное сравнение данных в них.
Transcriber – это очередная улучшенная версия утилиты для распознавания рукописного текста от Microsoft для Pocket PC. Программа "понимает" печатные буквы, обыкновенный почерк (со слитным написанием букв) и даже способна распознавать смешанный текст. Как утверждает разработчик, продвинутый искусственный интеллект с нечеткой логикой сможет "прочитать" даже те записки, которые из-за корявого почерка не способен расшифровать ни один человек!
Elan – это очень удобная программа для аннотации аудио- или видео- записей. В ELANе можно работать либо с аудиофайлом, либо с аудио- и видеофайлом вместе.
Программа ELAN – разработана в НИИ Психолингвистики им. Макса Планка в Неймегене, Голландия, специально для архивирования записей языков, находящихся под угрозой исчезновения.
Чтобы начать вводить аннотации, нужно сначала активировать тот уровень аннотации, в который Вы хотите вводить аннотации. Потом нужно выделить тот кусок речи, который Вы хотите аннотировать – одно предложение, например. В этом помогает звуковая волна, где можно видеть снижающуюся интонацию, или речевые паузы. После этого в активированном уровне при двойном клике мышкой по выделенному фрагменту открывается окно для аннотации, куда можно вписать транскрипции (перевод, комментарий и др.).
EXMARaLDA – это система понятий, форматы данных и инструментов для автоматизированной транскрипции и аннотации разговорного языка, так и для построения и анализа разговорного языка.
corpora.EXMARaLDA предлагает мощный набор инструментов для работы с языком транскрипции и аннотации данных дискурса.
Onze Miner – это система понятий, форматы данных и инструментов для автоматизированной транскрипции и аннотации разговорного языка, так и для построения и анализа разговорного языка.
corpora.EXMARaLDA предлагает мощный набор инструментов для работы с языком транскрипции и аннотации данных дискурса.
TMPGEnc – это программа, которая конвертирует AVI файлы в MPEG1 формат, который же используется в VideoCD. Используя различные опции в TMPGEnc, вы можете сжимать видео файлы в высоком качестве.
TMPGEnc позволяет настроить битрейт, матрицу квантования, GOP структуру, через многие параметры, так что вы можете создать наиболее подходящий файл фильма, который будет зависеть от ваших целей.
Программа является бесплатной
Anvil – является универсальным инструментом для аннотирования оцифрованного видео лингвистическими, невербальными и другими описательными данными.
Аннотация происходит на свободно определяемом, несколько слоев (треки), вставляя объекты пар атрибут-значение. Общий подход позволяет применять различные схемы аннотации. Anvil предоставляет методы для кросс-уровня связи. Он не зависит от платформы, сделан на основе XML и оснащен интуитивно понятным графическим интерфейсом.
IBM MPEG-7 Annotation Tool – это инструмент для аннотирования видеофрагментов из MPEG-7 метаданных. Каждый кадр в видео может быть нанесен со статическими описаниями сцены, ключевыми описаниями объекта, описаниями событий, а также другим набором лексики. Аннотированные описания хранятся в XML файле. Инструмент IBM MPEG-7, позволяет также открыть MPEG-7 файл для отображения аннотаций для соответствующего видеоряда.
WinPitchPro –это инструмент для создания мультимодальной транскрипции и выравнивания программного обеспечения, со встроенным акустическим анализом (спектрограммы, фундаментальные отслеживания частоты, интенсивности) и повторного синтеза (просодический морфинг).
XML и Excel продукции, полностью совместимы с Юникодом программы.
CLAware – представляет собой программное приложение, специально предназначенное для эффективной подачи, извлечения и анализа данных, полученных в процессе изучения нового языка и культуры, что позволяет межкультурным рабочим тратить меньше времени на управление своими данными, создавать перекрестные ссылки на текст и секции аудио файлов, встроенные изображения и звуки, обрабатывать файлы, автоматически создавать словарь, синхронизировать информацию между партнерами, и многое другое.
OntoLing Tab - представляет собой подключаемый модуль, с помощью которого есть возможность обогащать языковую онтологию.
При помощи модуля:
1) можно изучать имеющиеся языковые ресурсы (например: тезаурусы, словари и др);
2) лингвистически обогащать свою онтологию элементами из этих языковых ресурсов
3) имеется возможность строительства новой онтологии.
Доступ к любому языковому ресурсу (LR) может быть получен за счет реализации собственной оболочки, называемый лингвистическим интерфейс, который описывает абстрактные классы и интерфейсы, содержащиеся в пакете LinguisticWatermark.
Здесь вы можете скачать все инструменты для поддержки описания метаданных (IMDI). С помощью браузера IMDI Вы можете изучить существующие корпуса данных MPI, DOBES, CGN и другие.
Редактор IMDI используется для создания IMDI структуры метаданных и описания языковых ресурсов, такими способами как медиа-файлы и аннотации.
RSTTool представляет собой графический интерфейс для разметки структуры текста. Он состоит из четырех интерфейсов:
1) Text Segmentation: для обозначения границ между сегментами текста.
2) Text Structuring: для обозначения структурных отношений между этими сегментами.
3) Relation Editor: для поддержания множества дискурса отношений и схем.
4) Statistics: для получения простой описательной статистики на основе анализа.
Программа работает под Windows, Macintosh, Unix и операционной системе Linux, и не требует предварительной установки Tcl / Tk. Движок программы - скриптовый язык.
The Xerox Linguistics Environment является инструментом для анализа, в который входят передовые алгоритмы для анализа и формирования лексической функциональной грамматики (LFGs), а также богатый графический пользовательский интерфейс для написания и отладки таких грамматик.
Инструмент является основой для параллельного проекта грамматики, который занимается разработкой промышленного уровня грамматики на английском, французском, немецком, норвежском, японском и урду.
XLE написан на языке Си и использует Tcl / Tk для пользовательского интерфейса. В настоящее время он работает на операционных системах: Solaris Unix, Linux и Mac OS X.
Обзор программного обеспечения[ Audio Editing / Conversion ]
Macquirer and Pcquirer http://www.sciconrd.com/macquirerx.aspx
Мощная и платная система анализа речи.
С помощью нее можно захватывать, редактировать и анализировать звуковые сигналы одним нажатием кнопки. Частота, усиление, фильтр скорость контролируется программным обеспечением. Анализируются спектрограммы, интенсивности и высоты звука. Программа читает много типов аудио данных.
Praat http://www.fon.hum.uva.nl/praat/
Система Praat предлагает различные полезные инструменты для работы с речью данных, в том числе инструменты для расшифровки и аннотации на нескольких уровнях.
Эта компьютерная программа, позволяет анализировать, синтезировать и манипулировать речью, а также создавать высококачественные изображения для статей и тезисов.
Speech Tools http://www.fon.hum.uva.nl/praat/manual/Intro.html
Программы для фонетического и фонологического анализа (Phonology Assistant
IPA Help, Speech Analyzer).
Вы можете использовать Speech Analyzer:
Для выявления основной частоты, спектрального анализа и продолжительности измерений.
Анализа музыкальных записей.
Замедлять воспроизведения, повторять композиции с целью оказания помощи в восприятии и мимики для изучения языка.
Программа Phonology Assistant отслеживает фонетические данные с клавиатуры и из речи записи анализатора звука. Она использует стандартные символы IPA для индексации и отображения данных.
Amadeus Pro http://www.hairersoft.com/pro.html
Представляет собой очень мощный звуковой редактор для поддержки различных форматов, включая MP3, AAC, Ogg Vorbis, Apple Lossless, AIFF, Wave и многих других. Он работает на MacOS 9.2 и до, а также изначально работал на MacOS X.
Другие особенности включают импорт / экспорт данных, возможность для разделения и объединения файлов вместе, и в режиме реального времени спектрального анализа и осциллографа.
Snack http://www.speech.kth.se/snack/download.html
Snack это инструментарий для обработки акустических данных с акцентом на свободу слова. Он имеет визуализацию в реальном времени, поддерживает множество форматов файлов, а также является расширяемым.
Просмотр речевого сигнала и возможность фонетических меток, всё это включено в пакет. Существует также Snack "плагин" для веб-браузеров. Wavesurfer это инструмент, основанный на Snack. http://www.speech.kth.se/wavesurfer/
Digidesign ProTools http://www.avid.com/US/resources/digi-orientation
Это полная интегрированная компьютерная студия для создания музыки. Разработанная той же командой инженеров, ответственных за системы высокого класса Pro Tools | HD, интерфейс Digidesign Pro Tools снабжен отличным аналоговым сигналом и преобразователем высокой производительности для лучшего звучания.
Включенное ПО Pro Tools на одной платформе используется в коммерческих объектах по всему миру и обеспечивает Pro совместимость студии и всего необходимое, чтобы сочинять, записывать, редактировать и микшировать музыку. Digidesign Pro Tools также предоставляет сторонние драйвера для надежной интеграции практически со всеми популярными аудио приложения записи.
Peak Pro http://www.bias-inc.com/downloads/updates/
Самый быстрый и самый мощный недешеый профессиональный инструмент для обработки звука, мастеринга CD для OS X, точного моно и стерео редактирования.
Как он гордо помечен производителем «Индустриальный стандарт».
Peak Pro — это полноценная рабочая станция «все-в-одном» с неплохим выбором собственных (DSP) эффектов обработки, и возможностью расширить этот набор плагинами BIAS, VST и Audio Units.
В новой версии 6.0 появились расширенные функции управления переходами и уровнями звука, редактирования, также было серьезно доработан интерфейс.
GoldWave http://www.goldwave.com/
GoldWave является высоко оцененный, профессиональный цифровой аудио редактор.Он полностью нацелен сделать все, от простейших записей до редактирования самых сложных обработок звука, восстановления, улучшения и преобразования. Он прост в освоении и использовании.
Особенности включают в себя огромное редактирования файла (4 ГБ и за ее пределами на NTFS-отформатированных дисков), высокое качество файлов (24 бит, 192 кГц), в режиме реального времени изображения (бар, волны, спектрограммы, спектр, измеритель уровня шума), уменьшение шума, экспрессивная оценка и многое другое.
Audition http://www.adobe.com/products/audition.html
Ранее известная как CoolEditPro, Adobe Audition имеет целый ряд функциональных возможностей. Вы можете перемещать громкость, панораму, эффекты; вы можете слушать и записывать изменения в миксе в реальном времени, в режиме реального времени есть входной контроль.
Продукция высокого разрешения, 24 - или 32-разрядные файлы с частотой дискретизации до 192 кГц для аудио и HD-DVD-качества.
Создайте настроенный набор команд, скриптов и эффектов, которые легко доступны через меню Существует избранный или назначаемый набор сочетаний клавиш.
Легко восстановить записи из старых виниловых пластинок, удалить микрофонный треск, шипение, шумы, исправление обрезанных аудио, шумоподавление, и многое другое.
Audacity http://audacity.sourceforge.net/
Audacity - это цифровая аудио-студия (digital audio studio), то есть программа, в которой можно микшировать звуковые дорожки, обрабатывать их эффектами и редактировать звуковой материал.
Программа распространяется свободно, занимает 4 КБ,имеет достаточно простой интерфейс и доступна для всех наиболее распространенных операционных систем. Кроме этого, в ней есть возможность редактировать звуковую дорожку. Рассчитывать на высокое качество записи не придется, однако этот вариант вполне приемлем для пробы сил и анализа своих возможностей.
WaveSurfer http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=158
WaveSurfer - это инструмент с открытым исходным кодом для звука визуализации и манипуляции. Она была разработана, чтобы удовлетворить как новичкам, так и продвинутых пользователей.
WaveSurfer имеет простой и логичный пользовательский интерфейс, который обеспечивает функциональность в интуитивно понятным способом, и которые могут быть адаптированы к различным задачам. Он может быть использован в качестве автономного инструмента для широкого круга задач в исследовании слова и образования. Типичные области применения речи / обоснованного анализа и звука аннотации / транскрипции.
WaveSurfer также может служить платформой для более продвинутых и специализированных приложений. Это достигается либо путем расширения сферы применения WaveSurfer с новых пользовательских плагинов или путем встраивания компонентов WaveSurfer визуализации в других приложениях.
Sound Forge http://www.sonycreativesoftware.com/soundforgesoftware
Sound Forge - это очень мощный и удобный цифровой аудио-редактор, в состав которого входит набор утилит, предназначенных для работы со звуком. При помощи данной программы можно эффективно обрабатывать звуковые композиции, накладывать множество эффектов, осуществлять точную и быструю запись и редактирование сэмплов, кодировать данные, перегонять файлы в различные форматы и т.д.
Clan http://childes.psy.cmu.edu/clan/
Программа CLAN загружается, устанавливается и используется в качестве отдельного приложения.
Функционально, CLAN состоит из двух частей.
1)Первая часть CLAN редактор, который может быть использован для редактирования файлов в любой чат или СА (Беседа анализа) формате. Редактор также предоставляет широкий спектр дополнительных функций, таких как аудио и видео, связь с аудио и видео, шрифты для римской и нелатинских орфографии, проверки данных, добавляя код в файлы, и доставки данных в другие программы.
2)Вторая часть клана есть множество программ для анализа данных. Эти программы запускаются из отдельного окна, называемые «Командные окна». Результаты аналитических программ направляются в «окна Вывода» CLAN.
WinCecil http://www.sil.org/computing/catalog/show_software.asp?id=65
Программа WinCECIL предназначена для акустического и перцептивного анализа звучащей речи, при этом максимальная длительность анализируемого сигнала - 13 секунд. Ввод речи осуществлялся с видеокассеты на компьютер, при этом все виды анализа и все формы представления речи осуществляются и выводятся на экран в реальном масштабе речи.
Transana http://www.transana.org/
Transana - инструмент для профессиональных исследователей, которые хотят разложить цифровое видео или аудиоданные. Transana позволяет вам анализировать и управлять своими данными очень сложными способами. Запишите, идентифицируйте аналитически интересные клипы, присвойте ключевые слова клипам, расположите и перестройте клипы, создайте комплексные наборы взаимосвязанных клипов, зондируйте отношения между примененными ключевыми словами, и совместно используйте ваш анализ с коллегами.
Результат - новый способ сосредоточиться на ваших данных, и новом способе управлять большим количеством видеофайлов и аудиофайлов и клипов.
Особенности устройства:
- Запишите видеофайлы или аудиофайлы.
- Идентифицируйте и легко получите доступ к аналитически существенным частям видеоданных.
- Управляйте большими телевизионными наборами, содержащими сотни (и потенциально тысячи) часов видео.
- Организуйте видеоклипы в значимые категории, как механизм для разработки и расширения теоретического понимания того, что показывает видео.
- Примените доступные для поиска аналитические ключевые слова к этим видеоклипам.
- Просмотрите графические и основанные на тексте отчеты о своем аналитическом кодировании.
- Участвуйте в комплексном анализе данных и тестировании гипотезы через большие телевизионные наборы.
- Совместно используйте аналитическую разметку с удаленными коллегами, чтобы облегчить совместный анализ.
[Comparative Linguistics]
Wordcorr http://wordcorr.org/
Wordcorr – это новый инструмент для исследования и преподавания в сравнительной лингвистике, в настоящее время в производстве версия 2.0 для Windows 98/2000/XP.
Wordcorr автоматизирует утомительные процессы подведения итогов и управления звуковыми соответствиями, используемые в разработке исторического развития естественных языков. Данные могут быть введены с клавиатуры и отредактированы в полном Unicode. Электронные таблицы, WordSurv и Palmsurv, они опираются на экспорт внутренней базы данных Wordcorr в том числе анализы XML-файлов.
Filemaker Pro http://www.filemaker.com/products/fmp/index.html
Filemaker Pro –это передовая и простая в использовании программа работы с базами данных, с помощью которой пользователи Windows Mac могут без опасений обмениваться информацией в популярных форматах, например PDF, через локальную сеть и через Интернет. Способность FileMaker Pro 10 упорядочить важные данные так, чтобы их можно было мгновенно найти, пригодится вам в управлении клиентской базой,лежении за ходом проекта, подготовке инвентарного отчета и других задачах.
FileMaker Pro 10 оснащен инструментом для пошагового создания отчетов, который поможет разобраться в данных и автоматизировать выполнение однообразных задач. Используйте "Помощник отчетов" для создания пользовательских макетов, меток и отчетов.
[Concordancing]
MonoConc Pro http://athel.com/product_info.php?products_id=80&osCsid=a24ed6bab1462a51a3d1a51b94fb82cb
MonoConc Pro – быстрая программа конкорданс для переводчика (извлечение терминологии). Она используется для анализа английских или других текстов - испанских, французских, японских, китайских и т.д. - для лингвистического или языкового преподавания и изучения языков (ESL). Наряду с предоставлением KWIC результатов конкордансом, программное обеспечение производит также информацию о списках слов и словосочетаний.
Программа проста в использовании, хотя и поставляется с целым рядом мощных функций, таких как контекстный поиск, поиск по регулярному выражению, частеречный поиск по тегам, сочетаемости слов и корпус сравнения.
Программа MonoConc Pro разработана для работы в компьютерных сетях и работает под управлением Windows в различных средах (W95 и выше). Имеет приемлемое количество настроек для поиска, но при этом является платной.
Shoebox http://www.ethnologue.com/tools_docs/shoebox.asp
Shoebox – это компьютерная программа, которая помогает лингвистам и антропологам интегрировать различные виды текстовых данных: лексических, культурных, грамматических и т.д.
Она имеет гибкие настройки для сортировки, отбора и отображения данных. Это особенно полезно для оказания помощи исследователям, построить словарь, так как они используют ее для анализа текста.
CONC http://www.sil.org/computing/conc/
Программа для Macintosh, которая производит ключевые слова в контексте соответствующих слов в тексте. Программа также может сделать письмо согласований для облегчения фонологического анализа. Программа позволяет пользователю ограничить согласование только те слова, которые соответствуют заданному шаблону (GREP выражение).
Конкордансы могут быть как распечатаны, так и экспортированы в текстовые файлы.
ZECKE http://www.rrz.uni-hamburg.de/
Программа ZECKE – это инструмент конкорданса, для разговорного языка транскрипции в формате EXMARaLDA.
Возможности программы:
Позволяет обычную строку выражения для транскрипции материала. Выводит результат в виде KWIC согласования с возможностью отображения результатов поиска в контексте, в музыкальном представлении записи и воспроизведение соответствующей части транскрипции аудио-или видеозаписи.
A Simple Concordance Program http://www.textworld.com/scp
A Simple Concordance Program – простая в использования и предоставляемой функциональности программа для переводчика, с помощью которой можно извлекать термины и словосочетания, задавая число слов в словосочетании. Поддерживаются алфавиты: Английский, Французский, Немецкий, Польский, Греческий, Русский.
Программа извлекает найденные термины в список, которые, после этого, могут быть отредактированы вручную.
Существует возможность подключить так называемый stop list - список из слов, которые не относятся к терминологии. К примеру, артикли, предлоги, общие слова (little, large). Вы можете взять stop list по следующей ссылке - скачать stop list (англ. язык, названия стран, предлоги, артикли, общие слова).
[ Corpora ]
IDD (The Indiana Dictionary Database) http://www.indiana.edu/~aisri/projects/idd/idd.shtml
Мультимедийная программа словаря базы данных в Microsoft Visual FoxPro, который был создан специально для составления словарей индейских языков. В настоящее время, программе находится в завершающей стадии разработки.
Программа предназначена для поддержки стандартного текстового языкового материала, а также звуковых данных, графических изображений и видеоклипов.
FASTR http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=108
FASTR – инструмент для автоматического индексирования и извлечения терминологии.
На входе корпус и перечень терминов, а на выходе индексированные данные корпуса, в котором признаются условия и варианты.
Программа может использоваться в двух режимах:
- Контролируемая индексация: вход состоит из корпуса и списка терминов;
- Бесплатная индексации: вход только состоит из корпуса, списка терминов, получаемых автоматически.
NLTK http://nltk.sourceforge.net/
NLTK – это природный инструментарий языка, представляет собой набор программных модулей, наборов данных и учебников для поддержки исследований, обучения в компьютерной лингвистике и обработки естественного языка.
NLTK идеально подходит для студентов, которые изучают НЛП (Natural Language Processing) или проведения научных исследований в НЛП или смежных областях, в том числе эмпирической лингвистики, когнитивной науки, искусственном интеллекте, поиске информации и машинном обучении.
NLTK успешно используется в качестве учебного пособия, как отдельных инструментов исследования, и в качестве платформы для систем прототипирования и создания исследований.
WinPitchPro http://www.winpitch.com/
WinPitchPro – это инструмент для выравнивания программного обеспечения, со встроенным акустическим анализатором: (спектрограммы, фундаментальные отслеживания частоты, интенсивности) и повторного синтеза (просодических морфинг).
Достоинства программы:
Переменная скорость воспроизведения, помощь выравнивания текста в речи. XML и Excel продукция, полностью совместима с Юникод.
Annotate http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=55
Annotate – это простой в использовании, удобный, настраиваемый, и графический инструмент для аннотирования предложения с синтаксическими структурами, которые были успешно использованы при создании Negra корпуса.
Annotate обеспечивает удобный и настраиваемый графический интерфейс пользователя, что значительно облегчает трудоемкую задачу синтаксической аннотации. По этой причине он уже используется в ряде проектов. Комментировать доступна бесплатно для научных целей.
Audiamus http://linguistics.unimelb.edu.au/thieberger/audiamusdemo.htm
Audiamus – создает связь между текстами и средствами массовой информации, на основе временного кода, получаемого от переработки в Transcriber или аналогичных программах.
Необходимость специального инструмента, возникла в отсутствии простого способа работы в интерактивном режиме с цифровой этнографические лентой поля, через их стенограмму.Инструмент разработан с ключевым принципом повторного использования и доступа к данным.
С Audiamus пользователь может нажать на любое предложение или кусок в корпусе и услышать его или просмотреть видео. Версия 2.3 добавляет возможность повторять играющие куски и замедлять.
Word Frequency Text Profiler http://www.edict.com.hk/textanalyser/
Word Frequency Text Profiler – этот инструмент можно использовать во многих отношениях для поддержки преподавания, обучения и исследований. Инструмент сравнивает все слова в тексте с двумя списками частотности слов, обеспечивает визуальный профиль распределения этих слов в тексте при печати, различные частотные диапазоныокрашиваются в разные цвета.
Emdros http://emdros.org/
Emdros – это процессор текстовой базы данных для аннотирования и анализа текстов.
Прикладные области применения включают лингвистику, публикацию, текстовую обработку, и любые другие области, которые имеют дело с аннотируемым текстом. Emdros обеспечивает концептуальную модель текста, который может весьма освобождать, чтобы использовать, как только это было схвачено.
Emdros имеет мощный язык запросов для поиска релевантных запросу данных. Это связующее звено, функционирующее между клиентской частью (написанной пользователем) и нижележащей базой данных. Имеет поддержку PostgreSQL и MySQL.
Emdros обеспечивает определенную абстракцию текста, который делает его идеально подходящий для хранения и восстановления аннотируемого текста, такого как лингвистические исследования текста.
Systemic Coder http://www.wagsoft.com/Coder/index.html
SystemicCoder - программа, облегчающая процесс метаописания корпуса текстов. Метаданные задаются на основе классификационной схемы.
Программа состоит из 5 интерфейсов.
Text Segmentation: разметка границ между сегментами текста;
Scheme Management: настройка классификационной схемы;
Coding: разметка текста;
Review: просмотр размеченного текста;
Statistics: интерфейс, позволяющий получить описательную статистику о тексте, или разделить его на две или более совокупности и статистически их сравнить.
Данный инструмент способствует языковой кодировки материала, через побуждение пользователей к соответствующим категориям. Лингвистические особенности организованы с точки зрения системной сети - иерархия наследования - уменьшает количество кодирования.
[ Lexicon Management ]
GNU Emacs http://www.gnu.org/software/emacs/emacs.html
Emacs - это программа с практически неограниченными возможностями. Emacs написан на Lisp - очень мощном языке программирования, характерной особенностью которого является то, что любая написанная на этом языке программа автоматически сама для себя является компилятором Lisp. Это означает, что пользователь может самостоятельно расширять возможности Emacs, а по сути писать новые программы “на Emacs'е”.
Существует две основные версии Emacs: GNU Emacs (эта версия входит в состав Slackware) и XEmacs. В настоящее время обе версии активно разрабатываются, и между двумя командами разработчиков ведётся тесное сотрудничество.
Toolbox http://www.sil.org/computing/toolbox/
Toolbox - представляет собой инструмент управления и анализа данных для лингвистов. Это особенно полезно для поддержания лексических данных, а также для анализа текста, но он может быть использован и для управления практически любыми данными.
Панель инструментов построена подобно программе Shoebox 5.
Toolbox добавляет поддержку Unicode, есть автоматическое переключение клавиатуры с Keyman 5 и 6, и проверка подстрочного текста. Проверка означает, что при повторном анализе текста, она не заменит ваш выбор, а просто увидит где есть неопределенность.
Поддержка Unicode не является полной, в частности, программа не поддерживает китайские иероглифы. Программа использует визуализацию Windows, следовательно, не поддерживает специальных символов в области использования, поэтому вы должны использовать Keyman для ввода данных.
XML экспорт поддерживается, но нет никакой проверки корректности.
SIL FieldWorks http://www.sil.org/computing/catalog/show_software.asp?id=89
FieldWorks – это ряд программных инструментов, которые управляют культурными и лингвистическими данными от начального набора до представления их для издания.
Выборка того, что поддерживает FieldWorks:
- процесс разработки Словаря, который определяет подход для создания и совершенствования словаря;
- категоризация культурных наблюдений;
- комплексные неримские сценарии, используется Unicode и разработанный SIL-Графит;
- большинство систем письменности (кроме вертикального сценария);
- ограниченная многопользовательская емкость, которая открывает дверь в кластерный проект, перерабатывает Интернет или LAN.
LinguaLinks Workshops http://www.sil.org/computing/catalog/show_software.asp?id=24
LinguaLinks Workshops – это программный инструмент, который управляет языковыми данными.
Инструмент включает в себя инструменты, которые помогут вам анализировать и публиковать тексты, управлять лексическими данными и опубликовать словарь.
Инструменты для анализа подстрочного текста включают: редактор словоформы, анализа морфологии, и инструмент инвентаря словоформы, который дает согласие на проявления словоформ в контексте.
Лексический менеджера баз данных объединяет лексические элементы с анализируемым текстом корпуса и поддерживает семантические перекрестные ссылки через тематические группы отношений и тезаурус категорий. Вся библиотека LinguaLinks входит в комплект поставки.
Lexique Pro http://www.sil.org/computing/catalog/show_software.asp?id=92
Lexique Pro – представляет собой интерактивный словарь, с гиперссылками между записями, категорий представлений, словаря обращений, поиска и экспорта инструментов.
Словарь может быть сконфигурирован для отображения панели инструментов / Shoebox баз данных в удобном для пользователя формате, так что вы можете распространять его среди других.
Программа читает данные из базы данных. Лексические статьи выводятся с левой стороны экрана в сортированном списке. На домашней странице, списки слов могут быть выбраны, щелкая по соответствующим буквам алфавита. Можно переместиться вокруг своего словаря, щелкая по гиперссылкам.
Lexique Pro создает гиперссылки к связанным записям, таким как синонимы, морфемы, основные записи, перекрестные ссылки и промежуточные штреки.
Можно включать одно или более изображений для каждой записи словаря. Поддерживаемые форматы изображения - JPG, PNG, GIF и BMP.
Ellogon http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=381
Ellogon – многоязычное, поперечная платформа, языковая окружающая среда, которая разработана для общего назначения, развитая помочь обоим исследователям, которые делают исследование в компьютерной лингвистике, так же как компании, которые производят и поставляют разработанные языковые системы.
Как языковая платформа, Ellogon предлагаетобширный набор услуг, включая инструменты для обработки и визуализации такста, HTML, XML данных. Поддержку лексических ресурсов как создание и вложение словарей, инструментов для того, чтобы создать аннотируемые корпуса, получая доступ к базам данных, сравнивая аннотируемые данные, или преобразовывая лингвистическую информацию в векторы для использования с различными машинными алгоритмами изучения.
PhoneBox http://www.sil.org/computing/phonebox/index.htm
PhoneBox – это утилита для фонологического анализа данных с использованием языка.
С PhoneBox вы можете:
1)использовать фонетические данные, собранные с панели инструментов без импорта или преобразования;
2)создать таблицу всех телефонов в ваших данных, и как часто они происходят (телефон инвентаризации);
3)создания среды-карты всех телефонов в ваших данных;
4)отметить телефоны, неопределенность в данных, а затем создать карты всех; неопределенных телефонов;увидеть, как интерпретация неоднозначного сегмента и неоднозначной последовательности влияет на слог модели данных.
5)создать диаграмму всех сегментов последовательностей в данных, которые соответствуют (графики распределения);
6)использовать любой шрифт или символ для обозначения поддерживаемых инструментов, в том числе Unicode UTF-8;
7)Импорт таблицы порожденных PhoneBox в Microsoft Word для отображения и печати, телефонные карты или карты распределения.
PhoneBox – стандартная программа для работы с данных в панели инструментов лингвиста.
PalmSurv http://www.sil.org/computing/catalog/show_software.asp?id=88
PalmSurv – это программное обеспечение, позволяющее делать списки слов в какой то области данных.
Различные представления данных позволяют визуально сравнивать списки слов. Данные списка слов могут быть переданы к настольному компьютеру через HotSync.
PalmSurv предназначена только в качестве сбора данных и не делает любой статистический анализ собранных данных.
System Quirk http://www.computing.surrey.ac.uk/SystemQ/
System Quirk – приложение предназначено для оказания помощи в создании и поддержании текстов и терминов. Эти приложения имеет особое значение для прикладных лингвистов и языковых инженеров.
Приложение использует действительно объектно-ориентированное представление данных терминологии и усовершенствованный анализатор текста и его визуализацию.
Менеджер терминологии данных системы Quirk уже настроен на поддержку терминологии баз знаний. Профиль для выполнения различных задач может быть предопределен опытным пользователем, чтобы начинающим пользователям работа была более продуктивной.
Kirrkirr http://nlp.stanford.edu/kirrkirr/
Kirrkirr – этот исследовательский проект изучает возможность использования программного обеспечения для автоматического преобразования лексической базы данных ("Словари"), направленной на обеспечение инновационного визуализации информации, особенно ориентированных на языки коренных народов.
ITP http://www.sil.org/computing/catalog/show_software.asp?id=18
ITP – представляет собой набор программных инструментов для разработки свода аннотированных подстрочных текстов.
ITP выполняет две основные задачи:
(1) он сохраняет вертикальное выравнивание подстрочных примечаний;
(2) в нем хранятся все аннотации лексической базе данных, что позволяет полуавтоматический глоссинг.
Он поддерживает до 14 уровней согласования аннотации текста и до 8 различных произвольной формы (nonaligning) аннотации. Подстрочный текстовый файл производства - это обычный текстовый файл, доступный для других текстовых программ по обеспечению текстовойобработки.
XMLSpy http://www.altova.com/xml-editor/
XMLSpy – это лидирующая среда разработки XML в своей сфере, предоставляющая понятные редакторские виды и мощные XML утилиты, для моделирования, редактирования, трансформации и устранения неполадок технологий относящихся к XML быстро и легко.
XMLSpy стал одним из наиболее признанных инструментов своей категории вскоре после его выпуска в 1999. Продукт часто обновляется, чтобы обеспечивать поддержку новейших технологий. Была добавлена поддержка стандарта Office Open XML, применяющегося в Microsoft Office 2007.
XMLSpy поддерживает несколько режимов и возможностей редактирования, как например:
1)Создание и редактирование документов на основе XML
2)Визуальная разработка XML Schema
3)Редактирование DTD
4)Разработка и отладка XSLT 1.0/2.0
5)Разработка и отладка XQuery
6)Разработка и анализ XPath 1.0/2.0
7)Разработка Office Open XML
8)Разработка веб-служб
9)Графическое создание и редактирование WSDL
10)Разработка и отладка SOAP
11)Генерация кода Java, C++, C#
[ Tagging]
AGTK (Annotation Graph Toolkit) http://agtk.sourceforge.net/
AGTK - это набор программных компонентов для создания инструментов для аннотирования языковых сигналов, временных рядов данных, которые документирует любое языковое поведение (например: аудио, видео).
Annotation Graph абстрагируются от форматов файлов, схем кодирования и пользовательских интерфейсов, обеспечивая логический уровень для аннотационных систем.
Ktagger http://www.sil.org/computing/catalog/show_software.asp?id=22
Ktagger – это автономное приложение, построенное с базовыми функциями PC-Киммо в разборе. Она принимает в качестве входных файлов список слов, состоящих из одного слова в каждой строке, и производит на выходе структурированные текстовые файлы, содержащие морфологический разбор. Содержание и формат выходного файла определяется "контроль" файл построенный пользователем.
KTagger может быть использован для производства лексикона слова или любого другого вида структурированного выхода. Для использования KTagger, необходимо PC-Киммо языка описания, такие как Englex. Описание должно включать файл грамматики.
KTagger позволит вам использовать морфологический анализатор для маркировки.
MediaTagger http://www.tucows.com/preview/287830
MediaTagger – является бесплатной программой, для редактироватния комментариев (тегов) в мультимедийных звуковых файлах.
Формат MP3 (уровень MPEG 3) является форматом музыкального файла. Каждый файл MP3 может содержать тег ID3. Это - фактически информация, хранящаяся прямо в том файле MP3. У тега ID3 есть несколько ячеек, которые можно установить: Артист, Альбом, Год, Жанр, Комментарий и еще несколько, такие как: Формирователь, Исходный артист, Авторское право, URL, тип Кодера, и т.д.
Ktext http://www.sil.org/computing/catalog/show_software.asp?id=23
Ktext – читает текст из файла на диске, анализирует каждое слово с помощью анализатора PC-KIMMO и записывает результаты в новый файл на диске.
Этот новый файл в виде структурированного текстового файла, где каждое слово исходного текста представляется в виде записи в базе данных состоящей из нескольких полей. Каждое слово записи содержит поля для исходного слова, поле для основной или лексической формы слова.
LINGuistic Ontology http://database.cs.wayne.edu/proj/lingoes/
LINGuistic Ontology – является основой для лингвистов и позволяет в полной мере воспользоваться семантическими веб-технологиями.
Программа позволяет лингвистам размечать любой документ с классами в одной или нескольких онтологиях на уровне морфем.
PC-Parse http://database.cs.wayne.edu/proj/lingoes/
PC-Parse – этот архив содержит набор программ для выполнения морфологического или синтаксического анализа. PC-PARSE включает в себя код.
AMPLE;PC-KIMMO;PC-PATR;STAMP;ToneGen; TonePars.
WinCecil http://www.sil.org/computing/catalog/show_software.asp?id=65
WinCecil – программа для просмотра записи речи и составления спектрограмм. Предел записи речи составляет 3 секунды.
Модернизированная версия называется Speech Analyzer, которая является свободным и профессиональным инструментом, который показывает различные графические изображения речи и звукозаписей. Это позволит вам выполнять фонетический анализ записей человеческого голоса (полный со спектрограммами, спектральным анализом, и т.д.), и этнологические изучения звукозаписей. Программа может показать вам до шести графических изображений того же самого звука или группу звуков в одном единственном экране, таким образом облегчающем для вас выполнять все виды сравнительного анализа. Все доступные графики могут быть полностью настроены, чтобы приспособить ваше предпочтение.
[ Text Editing ]
AMPLE http://www.sil.org/computing/catalog/show_software.asp?id=1
AMPLE - это морфологический анализатор для лингвистического исследования, при наличии необходимых сведений о морфологии языка, достаточно будет проанализировать каждое слово в тексте и разбить его на морфемы.
AMPLE ориентирован на "пункт и расположение" подход к описанию морфологических явлений. AMPLE работает вместе с печатью (OPAC 15) для автоматизированного связанной адаптации языка (CARLA). Он также может быть использован в сочетании с ITF (OPAC 17),для публикации текстов.
ATP (Annotated Text Processor) http://www.indiana.edu/~aisri/projects/atp/atp.html
ATP - представляет собой текстовый процессор предназначенный для управления подстрочным текстом и поддержанием операций нескольких видов: лингвистического анализа, включая синтаксический анализ и глоссинг.
Анализа подстрочного текста является одним из основных форм языкового исчисления, в котором текст организован слово за словом, и выстраивается в блоки.
Редактор обеспечивает автоматизированный глоссинг, анализ и аннотацию лингвистических данных текста. По запросу возможно получить глоссы или аннотации к данному слову из коллекции до аннотаций в одном корпусе.
jEdit http://www.jedit.org/
jEdit – это бесплатный текстовый редактор созданный для упрощения работы программистов.
Среди возможностей управления открытым документом можно отметить средства для вертикального выделения, для выделения нескольких фрагментов текста, расположенных в разных местах файла. Если требуется найти в документе определенное сочетание символов, можно обратиться к встроенным средствам для поиска. jEdit позволяет выполнять поиск в нескольких файлах одновременно, автоматически заменять одно выражение другим.
Данный редактор отличная замена платным программам, имеется все функции для работы, возможности программы легко расширяются благодаря большому количеству плагинов. Имеется поддержка всех основных языков программирования и верстки.
Keyman http://www.tavultesoft.com/keyman/
Keyman – это менеджер горячих клавиш, который позволяет работать с нестандартными клавишами на мультимедийных расширенных клавиатурах, без установки дополнительных драйверов.
Программа проста в управлении, но содержит множество дополнительных настроек и будет полезна как простым пользователям, так и профессионалам - настоящим клавиатурным маньякам.
Возможности программы:
-Использование любых клавиш, в том числе системных – Win+D, Alt+Tab, ect.
-Использование кнопок мыши в горячих клавишах - Mouse LButton, Mouse RButton, Mouse MButton, Mouse XButton1, Mouse XButton2 (например: Ctrl+Alt+Mouse MButton).
-Запись и воспроизведение клавиатурных макросов.
-Изменение клавиатурных раскладок.
-Отправление окна сообщения при нажатии клавиши.
-Многоязычный интерфейс.
Graphite http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&cat_id=RenderingGraphite
Graphite – это проект, который может быть использован для создания "умных шрифтов", способных отображать системы письма различными сложными формами поведения.
Graphite предназначен для использования в качестве основной нелатинской визуализации для пакета работ, нового поколения языковых средств для перевода по развитию в SIL. Библиотеки Graphite доступны для любого разработчика программного обеспечения, который работает по развитию многоязычных приложений обработки текста.
Ukelele http://scripts.sil.org/ukelele
Ukelele – это редактор раскладки клавиатуры для операционной системы Mac OS X версии 10.2 и выше.
Целью редактора является упрощение редактирования раскладки клавиатуры, предоставляя графический интерфейс.
При создании новой раскладки вам предложат создать абсолютно пустую, либо основанную на системной или готовой. Надёжнее выбрать третий вариант и нажав «ОК» найти среди полученный с программой раскладок русскую (Cyrillic/Russian.keylayout). Перед вами появится готовая раскладка, которую можно изменять на ваше усмотрение.
TypeTool http://www.fontlab.com/FontEditors/TypeTool/
TypeTool – редактор шрифтов с базовой функциональной нагрузкой. Программа создана на основе пакета FontLab, отличается от него упрощенностью и более низкой ценой. Редактор предназначен для создания новых и редактирования готовых шрифтов форматов Post Script Type 1 (CFF/.otf) и TrueType (.ttf).
С помощью TypeTool можно создать новый шрифт, добавить лигатуры, дроби, валютные знаки. Поддерживаются неалфавитные шрифты и политипажи. В готовый шрифт можно добавить короткое тире, длинное тире, апострофы, кавычки. Возможно создать модификацию шрифта, а также преобразовать его формат. TypeTool имеет встроенные средства для печати таблиц символов.
Операциииинструменты, доступныев TypeTool: Draw, Erase, Rotate, Skew, Zoom, Set Startpoint, Insert Node, Remove Overlap, Merge Contours, Subtract Contours, Intersect Contours, Snap to Guides, Ruler, Undo (200 позиций), Autohint, Remove hints, Decompose.
К сожалению, программа не имеет русификации и руководства на русском языке. Поэтому для начала будет полезно открыть готовый шрифт и на нем изучить основные операции. После этого можно приступать к выполнению более сложных задач.
DGgraph http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=269
DGgraph – является PostScript-библиотекой, которая используется для создания дуг графа, опирающаяся на спецификацию графа зависимостей (синтаксис дерева).
PostScript файл может быть преобразован в другие графические форматы, такие как EPS / EPSF, PS, PDF, PNG, GIF, и JPEG.
DGgraph позволяет пересечению дуг (разрывов), что позволяет каждому узлу содержать произвольное количество меток, расположенных друг под другом. Таким образом, можно сделать два набора дуг: один набор над узлами, и другой набор узлов ниже. Последнии распадаются на несколько строк и страниц, если график не помещается на одной строке или странице.
FontLab Studio http://www.fontlab.com/FontEditors/FontLab-Studio/
FontLab Studio – это уникальный профессиональный редактор шрифтов. Программа, которая даёт возможность редактирования шрифтов на профессиональном уровне.
Она используется такими известными компаниями, как Adobe, Apple, Bitstream, IBM, Linotype, Microsoft, Monotype и многими другими. Fontlab Studio создана для печатников, профессиональных дизайнеров и студии, занимающихся графическим дизайном. Она поддерживает такие шрифты как TrueType, Type 1 (PS), OpenType и Unicode. FontLab Studio обеспечивает огромный выбор различных функций для создания, модификации и обработки шрифтов.
[ Transcribing ]
SignStream http://www.bu.edu/asllrp/SignStream/
SignStream – это инструмент для анализа языковых данных, полученных из видео. SignStream разработан специально для работы с данными из американского языка жестов, но этот инструмент может быть применен к любому языку данных, полученных из видео.
SignStream предоставляет единую среду для работы с цифровым видео и связывания последовательностей кадров, одновременно, с происходящими языковыми событиями, которые закодированы в мелкозернистые многоуровневые транскрипции.
Предоставляя усовершенствованные возможности поиска, SignStream предоставляет мгновенный доступ к данным. Кроме того, многочисленные высказывания могут быть открыты одновременно, что позволяет одновременное сравнение данных в них.
Transcriber http://trans.sourceforge.net/en/presentation.php
Transcriber – это очередная улучшенная версия утилиты для распознавания рукописного текста от Microsoft для Pocket PC. Программа "понимает" печатные буквы, обыкновенный почерк (со слитным написанием букв) и даже способна распознавать смешанный текст. Как утверждает разработчик, продвинутый искусственный интеллект с нечеткой логикой сможет "прочитать" даже те записки, которые из-за корявого почерка не способен расшифровать ни один человек!
Elan http://www.lat-mpi.eu/tools/elan/
Elan – это очень удобная программа для аннотации аудио- или видео- записей. В ELANе можно работать либо с аудиофайлом, либо с аудио- и видеофайлом вместе.
Программа ELAN – разработана в НИИ Психолингвистики им. Макса Планка в Неймегене, Голландия, специально для архивирования записей языков, находящихся под угрозой исчезновения.
Чтобы начать вводить аннотации, нужно сначала активировать тот уровень аннотации, в который Вы хотите вводить аннотации. Потом нужно выделить тот кусок речи, который Вы хотите аннотировать – одно предложение, например. В этом помогает звуковая волна, где можно видеть снижающуюся интонацию, или речевые паузы. После этого в активированном уровне при двойном клике мышкой по выделенному фрагменту
открывается окно для аннотации, куда можно вписать транскрипции (перевод, комментарий и др.).
EXMARaLDA http://www1.uni-hamburg.de/exmaralda
EXMARaLDA – это система понятий, форматы данных и инструментов для автоматизированной транскрипции и аннотации разговорного языка, так и для построения и анализа разговорного языка.
corpora.EXMARaLDA предлагает мощный набор инструментов для работы с языком транскрипции и аннотации данных дискурса.
Onze Miner http://www1.uni-hamburg.de/exmaralda
Onze Miner – это система понятий, форматы данных и инструментов для автоматизированной транскрипции и аннотации разговорного языка, так и для построения и анализа разговорного языка.
corpora.EXMARaLDA предлагает мощный набор инструментов для работы с языком транскрипции и аннотации данных дискурса.
[ Video Editing/Conversion ]
TMPGEnc http://www.tmpgenc.net/
TMPGEnc – это программа, которая конвертирует AVI файлы в MPEG1 формат, который же используется в VideoCD. Используя различные опции в TMPGEnc, вы можете сжимать видео файлы в высоком качестве.
TMPGEnc позволяет настроить битрейт, матрицу квантования, GOP структуру, через многие параметры, так что вы можете создать наиболее подходящий файл фильма, который будет зависеть от ваших целей.
Программа является бесплатной
Anvil http://registry.dfki.de/sections.php3?f_mainsection=8&f_section=43&f_system=160
Anvil – является универсальным инструментом для аннотирования оцифрованного видео лингвистическими, невербальными и другими описательными данными.
Аннотация происходит на свободно определяемом, несколько слоев (треки), вставляя объекты пар атрибут-значение. Общий подход позволяет применять различные схемы аннотации. Anvil предоставляет методы для кросс-уровня связи. Он не зависит от платформы, сделан на основе XML и оснащен интуитивно понятным графическим интерфейсом.
IBM MPEG-7 Annotation Tool https://www.ibm.com/developerworks/community/alphaworks/aw.nsf/techs/videoannex
IBM MPEG-7 Annotation Tool – это инструмент для аннотирования видеофрагментов из MPEG-7 метаданных. Каждый кадр в видео может быть нанесен со статическими описаниями сцены, ключевыми описаниями объекта, описаниями событий, а также другим набором лексики. Аннотированные описания хранятся в XML файле. Инструмент IBM MPEG-7, позволяет также открыть MPEG-7 файл для отображения аннотаций для соответствующего видеоряда.
[ Video/Audio Aligning]
WinPitchPro http://www.winpitch.com/
WinPitchPro –это инструмент для создания мультимодальной транскрипции и выравнивания программного обеспечения, со встроенным акустическим анализом (спектрограммы, фундаментальные отслеживания частоты, интенсивности) и повторного синтеза (просодический морфинг).
XML и Excel продукции, полностью совместимы с Юникодом программы.
CLAware http://claware.com/
CLAware – представляет собой программное приложение, специально предназначенное для эффективной подачи, извлечения и анализа данных, полученных в процессе изучения нового языка и культуры, что позволяет межкультурным рабочим тратить меньше времени на управление своими данными, создавать перекрестные ссылки на текст и секции аудио файлов, встроенные изображения и звуки, обрабатывать файлы, автоматически создавать словарь, синхронизировать информацию между партнерами, и многое другое.
[ OTHER ]
OntoLing Tab http://ai-nlp.info.uniroma2.it/software/OntoLing/
OntoLing Tab - представляет собой подключаемый модуль, с помощью которого есть возможность обогащать языковую онтологию.
При помощи модуля:
1) можно изучать имеющиеся языковые ресурсы (например: тезаурусы, словари и др);
2) лингвистически обогащать свою онтологию элементами из этих языковых ресурсов
3) имеется возможность строительства новой онтологии.
Доступ к любому языковому ресурсу (LR) может быть получен за счет реализации собственной оболочки, называемый лингвистическим интерфейс, который описывает абстрактные классы и интерфейсы, содержащиеся в пакете LinguisticWatermark.
IMDI Browser/ Editor http://www.lat-mpi.eu/tools/imdi
Здесь вы можете скачать все инструменты для поддержки описания метаданных (IMDI). С помощью браузера IMDI Вы можете изучить существующие корпуса данных MPI, DOBES, CGN и другие.
Редактор IMDI используется для создания IMDI структуры метаданных и описания языковых ресурсов, такими способами как медиа-файлы и аннотации.
RSTTool http://www.wagsoft.com/RSTTool/index.html
RSTTool представляет собой графический интерфейс для разметки структуры текста. Он состоит из четырех интерфейсов:
1) Text Segmentation: для обозначения границ между сегментами текста.
2) Text Structuring: для обозначения структурных отношений между этими сегментами.
3) Relation Editor: для поддержания множества дискурса отношений и схем.
4) Statistics: для получения простой описательной статистики на основе анализа.
Программа работает под Windows, Macintosh, Unix и операционной системе Linux, и не требует предварительной установки Tcl / Tk. Движок программы - скриптовый язык.
XLE http://www2.parc.com/isl/groups/nltt/xle/
The Xerox Linguistics Environment является инструментом для анализа, в который входят передовые алгоритмы для анализа и формирования лексической функциональной грамматики (LFGs), а также богатый графический пользовательский интерфейс для написания и отладки таких грамматик.
Инструмент является основой для параллельного проекта грамматики, который занимается разработкой промышленного уровня грамматики на английском, французском, немецком, норвежском, японском и урду.
XLE написан на языке Си и использует Tcl / Tk для пользовательского интерфейса. В настоящее время он работает на операционных системах: Solaris Unix, Linux и Mac OS X.